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مقدمة عن علم التنقيب عن البيانات 

علم التنقيب عن البيانات ۽مام¡M‏ هاه( علم مستقل بحد ذاته » ولو أن بعض الباحثين يرى ربطه بعلم استجلاب المعلومات 
[nf دrmation Retrieval‏ » نظرا لأن هذا الأخير يعتبر أقدم بكثير من ال عمندزM‏ هه( و لكن يرى العديد من الباحثين 
اکا ان تووم اض ا ال ةح مل ب ا 

بعبارة بسيطة جدا ( قد تكون مخلة بعض الشيء ولكن لغرض التبسيط سأسردها ) يعتبر علم تنقيب البيانات العلم المسئول عن 
أساليب و طرق إنتاج المعلومات و قواعد المعرفة من خلال كم كبير من البيانات التي يتم التنقيب فيها و ربطها بأساليب علمية 
لنخرج بمعلومة أو معرفة جديدة 

على سبيل المثال لا الحصر › التصنيف الأوتوماتيكي للمستندات يعتبر من الجوانب التي يتناولھا علم Data Mining dl‏ « 
فهناك العديد من الخوارزميات التي من شأنها تصنيف المستندات بعد إعطائھا کم هائل من البيانات مربوطة بنوع هذه البيانات 
و تدريبها على ذلك تم إنشاء نظام متكامل للتصنيف اعتمادا على عملية التدريب 

دعني أضرب مثال عملي أكثر ... الجميع يعرف فلاتر البريد المز عج ( 1نةہ٤‏ صهم؟ ) التي تستخدمها شركات متل 
Yahoo‏ ! و Gmai1‏ و Hotmai1‏ ... الكل يعلم فائدتها و استخداماتها » ولكن طريقة عملها يجهلها الكثير ... تعمل هذه 
البرمجيات باستخدام خوارزمية تعرف ب هوم ه8 مه" » هذه الخوارزمية أو القانون من قوانين علم الإحصاء .. 

لست هنا بصدد شرح هذه الخوارزمية » ولكن لأذكر مثالا على استخدامات علم ال عمنماM‏ هاه( في التطبيقات › حيث 
أصبح ال إعssifiھاC Naive Bayesian‏ يدرس بكثافة في تطبيقات هذا العلم . 

ما هي أو ما معنى التنقيب في البيانات ؟ 

هي عملية بحث محوسب ويدوي عن معرفة من البيانات دون فرضيات مسبقة عما يمكن أن تكون هذه المعرفة. 

تعريف آخر:- 

هي عبارة عن تقنية تستخدم في عملية استخراج البيانات من قواعد بيانات عملت مثل قاعدة : 

Data ware haws 

Working wıth data mining 

5n‏ : تمكنك من الوصول إلي المعلومات التي تحتاجها لصناعة القرارات الذكية وذلك حول مشاكل الإعمال التجارية الصعبة 
هناك هدفان أساسيان للتنقيب في البيانات هم: 

التنقيب ألاستشرافي والتنقيب الوصفي. التنقيب ألاستشرافي ينتج عنه نموذج عن النظام الذي تصفه البيانات المستخدمة 
في التنقيب. أما التنقيب الوصفي فنتج معلومات جديدة بناء على المعلومات الموجودة داخل البيانات المستخدمة في عملية 
التنقيب. العمليات الأساسية التي تعتبر ضمن عمليات أو مهام التنقيب هي: 


اا 


. الانحدار 

۳ العنقدة (التجميع ) 

“. التلخيص 

.٥‏ نماذج الاعتماد 

.٦‏ الكشف عن التغيرات والانحرافات 


هناك ثلائثة أهداف للتنقيب فى البيانات : 
-١‏ من أجل تعليل بعض الظواهر المرئية. متال: لماذا زادت نسبة المدخنين في الوطن العربي؟ 


1- من أجل التثبت من نظرية ما. متال: التتبت من النظرية التي تقول بأن الأسر الكبيرة تهتم بالضمان الصحي أكثر من 
الأسر ا١‏ لصغيبر ة عددا. 


۳- من أجل تحليل البيانات للحصول على علاقات جديدة وغير متوقعة. مثال: كيف سيكون الإنفاق العام إن كان ملازما 


وسائل التنقيب فى البيانات : 


هناك عدة وسائل مختلفة من أجل التنقيب في البيانات. اختيار الوسيلة المناسبة يعتمد على طبيعة البيانات تحت الدراسة 
وعلى حجمها. يمكن اجراء عملية التنقيب في البيانات بالمقارنة مع سوق البيانات ومخزن البيانات. 


بعض من هذه الوسائل هي : 
- التفکیر واستخلاص النتائج والقوانین من Îمظlة‏ حيreasoningÃ Case-Based‏ 
- الكشف عن قانون :رإإم۷هءء¡ م1ں 8R‏ البحث عن منوال معين أو علاقة معينة في جزئية كبيرة من البيانات 
- معالجة الإشارات :ع«1ووعءهإ۴ 1همع1؟ إيجاد الظواهر المتشابه مع بعضها البعض 


- شبكات نووية N21 ٥s:‏ تطوير نماذج قابلة لتنبوؤ النتائج. هذه النماذج تم تطوير ها بناء! على أسس تم استنباطها 
من عقل الإنسان. 


- منحنيات غير ثابتة :5اه ءه۴۲ تصغير البيانات الكبيرة من دون ضياع المعلومات 
تطبيقات التنقيب في البيانات : 


وسائل التنقيب فى البيانات تستعمل وبنجاح فى الكثير من التطبيقات الحقيقة حول العالم. التطبيقات التالية تشمل بعضا من الأمثلة 


- كتابة تقرير مختصر عن فئة معينة :ئم 0ناھاuم‌ه٣۴‏ عہ1اگها۴ تطوير وإنشاء تقارير موجزة عن الزبائن المهمين 


وعن بطاقات الائتمان. 
- تحليل النز عة التجارية 1۲٥٣d:‏ ssوعہ1وںB‏ fه‏ ءزوراهم۸ إيجاد الأسواق ذات قدرات النمو القوية أو الضعيفة. 


- التسويق لفئة معينة :”)اج ءعإه٠‏ إيجاد الزبائن من أجل منح التخفيضات لهم لسبب معين. 


- تحليل الاستعمال Usage Analysis:‏ ايجاد منوال معين لاستعمال الخدمات والسلع 


- عة ائحİnذة Campaign Effectiveness:‏ مقارنة استراتیجیات الأحملات مع بعضها اليعض من أجل ايجاد أكثر ها 
فعالية وتأتيرا. 


- جاذبية السلعة: إيجاد السلع التي تباع مع بعضها البعض. 
تطبيقات التنقيب في البيانات بدأت تنمو بصورة كبيرة للأسباب التالية: 


-١‏ كمية البيانات الموجودة في مخزن البيانات وسوق البيانات تنمو بصورة أساسية .(121)رم”«همم×ءه) ومن أجل ذلك» فإن 
المستخدم يحتاج إلى أدوات متطورة من مثل التنقيب في البيانات من اجل استخلاص الفائدة والمعرفة من هذه البيانات. 


2- الكثير من أدوات التنقيب عن البيانات بدأت تظهر مؤّخراء وكل أداة أفضل من الأخرى. 


3 المنافسة الشديدة الموجودة في السوق تدفع الشركات إلى الاستفادة القصوى من البيانات التي بيدها. عمليات التنقيب في 
البيانات تفعل ذلك تماما. 


Microsoft SQL Server Analysıs (SSAS) 
Microsoft SQL Server 


يقوم بتزويد الأدوات للد إ5 والتي تقوم بتعريف القواعد والنماذج في بياناتك ولذلك يمكن تحديد لماذا 


Creating an analysıs services projJect : 


إنشاء مشاريع خدمات التحليل : لإنشاء لل „ٍ5 : أولا أن نتو ڊilشlء analysis services project‏ 
ل اعا فار اا ا رورت مر اا ول ا و 
جر ا ا ا د ا 
نموذج ال 5 الأساسية : 
Adding mining structures‏ إضافة هیاکل 

. تنقیب لمشروع خدمات التحلیل‎ Analysis server project 
بعد أن تقوم بإضافة )ءعز0إم إم۷إعء isزوراهم۸ يمكنك أن تقوم بعملية إضافة هياكل تنقيبيه إليها‎ 
. وكذلك واحدة أو أكثر من النماذج التنقيبة التي تعتمد منها على الأخرى‎ 
: الهياكل التنقيبية‎ 
OLAP : ) 01۸۴ تشمل على جداول وأعمدة وتكون مشتقة من مصادر بيانات عرض متوفرا ومن عملية‎ 
. أي عملية التخيل المباشر من موقع الانترنت‎ ) Onاine‎ Fanatical process 

Working with Dm models : 
CS E EEG O 
analysis services Jيلحتلا الخدمات‎ 


تستطيع المرور بعملية تدريب البيانات من خلال الخوارزميات لإنشاء التنبؤات : 2)11۶عإ› 
predictions‏ 

- الهدف الرئيسي من معظم مشاريع تنقيب البيانات يكون مستخدما لنماذج التنقيب وذلك لإنشاء التنبؤات بعد 
أن يقوم بعملية استكشاف ومقارنة نماذج التنقيب . 

- تستطيع أن تستخدم واحدة لإنشاء نماذج التنبؤات 


خدمات التحليل : 
- تقوم بتزويدك بلغ الl~تعlمlٽت Dmx = Data miming Extension‏ 
- عرف كلأ من المصطلحات التالية Dmx — SSAsd)‏ ( الت تستخدم لعملية إنشاء التنبؤات 
SQL server Reporting : -‏ 
التقارير الموجودة في )85۸6S(‏ لإنشاء التقارير والتي يمكن أن تقوم بتمثيل المعلومات المحتوية 
عليها نماذج التنقيب كذلك يمكن استخدام استعلام (× 5(۷ ) كأقصى للتقارير 
- وتستطيع أن تأخذها كميزة لعملية الإثبات وتهيئة المميزات والتي تكون في خدمات التقارير 
Working programinatically unit Dmx -‏ 
- العمل برمجي مع ×5 
- ال×ص_5 تقوم بتزويدك بالجمل البرمجية التي تستطيع أن تستخدمها لإنشاء وتدريب نماذج تنقيب 
البيانات كذلك بإمكانك أداء عدة مهمات باستخدام إتحاد كلأ من 1س× لعملية التحليل (1؟S؟۸5)‏ أو 
ڊwlتخدpl Analysis services languages‏ 
Analysis management object = Amo -‏ تحلیل کائنات إداریة . 
- تشغيل حزمة 9Q1‏ : 
لكي يصبح ١٥۲۷ع 8Q1‏ شغال بشكل اتوماتيكي كلما أقلع الحاسبو تقوم بالآتي : 
نقوم بالدخول الي sءعإ۷إعS‏ عن طريق ادوات النظام administrator too]‏ 
نقوم بتحدید ١٤۷عء 8Q1‏ تم و بالدخول خصائص 
من القائمة عمرا من ٤إه)ء‏ نقوم باختيار الخيار أوتوماتيك ( icاھ(Aut0n)‏ . 
. ثم نقوم بتحدید ١٤,ع‌ع۸‏ إع۷إعء 1اSQ‏ من ءءء مء - فائدة يقوم بتشغيل التقارير 
والاستعلامات تم ندخل إلي خصائصها ونعملها تو ماتبات 
تفعيل الخدمات الأخرة التابعة إعم۷إعء 9Q1‏ : للعمل مع خدمات إع۷إعء 8Q1‏ يجب تفعيلها قبل 
العمل معها وبالغالب يتم تفعيل هذه الخدمات لتعمل معها يدوي بغرض تحيلي وتنقيب ( استخراج ) 
البيانات من قاعدة البيانات . 
- ومن أهم هذه الخدمات الثانوية ٠‏ 
SQ1 server Analysis services )SSAS) -‏ هذه الخدمة تعمل على عملية تحليل البيانات ويمكن 
انشاء فيھا 1عل0ص Structure‏ وها يعني انه يوجد مصدر ڊlıنlٽ Data Minig wizard‏ ) 
معالج تنقيب البيانات ) 
- طريقة دخJ‏ |آ SQI server Analysis services (SSAS)‏ : 
.١‏ نقوم ڊتشغJı‏ lبرaliج SQI server Manegement studio‏ . 
1. نقوم بعملية الاتصال بقاعدة البيانات وال إع۷إعك 
ملاحظة ( يمكن تشغيل أكثر من قاعدة عن طريق سثقرثق وذلك عن طريق الزر 8١٥امه‏ ثم نقوم باختيار 
قاعدة بيانات الافتراضية ) 
وتتم عملية الاتصال ل server‏ من illو‏ ع Analysis service‏ 
.١‏ من القائمة server type‏ نقوم باختیار اسم الخادم المناسب المفعل في الحاسوب و عادة يكون اسم 
ا ار ای ق ی ا 


n. E 4 ص‎ | 


ويمكنك الدخول الي خوادم أخرى موجودة في الشبكة من النو ع lan < wan‏ وذلت کالتالی ٠‏ 
- من القائمة عصھم server‏ نختار llتبويب network Service‏ 
. في حاله وجود شبكة من النوع مه1 فقط فلا يمكن الدخول فقط الي الاجهزة الموجودة في نفس 
المعمل أو نفس المبنى . 
* سؤال عملي ( قم بالدخول الي اسم الخادم المسمى 3ءم الموجود في الشبكة وذلك عن طريق خادم من 
Analysis server ggill‏ 
RE E a a‏ 


minl 


اأجرlء TakeOffLine‏ 
عذم تمن الكراد الأخرى إلى الذخرل إلى س هد د القاعة ج بعد ف الاخراء سروف كرن غل 
بالضغط على زر الماوس الايمن في قاعدة البيانات و نضظغخط TakeOffLıIne pû Tasks‏ 
الاجراء الثاني عيaطهاةل‏ رمه : عملية النسخ نقوم بعملية نسخ قاعدة البيانات من عء,«هاوم]ً الي 
٤4ا‏ آخر وذلك لغرض حماية البيانات وتبقي كقاعدة حيث اذا ما تضررت القاعدة الحالية 
لاجر copy database ةılkع +I‏ 
وتتم عملية اجراءات النسخ لقاعدة البيانات . 
. نقوم بتحديد قاعدة البيانات المراد قفلها إلى ععمهاوم1 أخر واختر هdat copy‏ 
. نقوم بضغط )×ع" 
. نقوم بتحديد اسم الخادم المصدر عع۲ S01‏ 
. ثم نقوم بتحديد نوع التحويل ثم )×ع" 
. نقوم بتحديد الخادم للهدف المراد نقل قاعدة البيانات الموجود المراد نقل قاعدة البيانات اليها 
المحتوى على ععم ins)‏ 
1. نقوم بالضغط على ×عم ثم نقوم باختيار الطريقة التي سوف نقوم باستخدامه في عملية النسخ 
والنقل . 
أ- أ) الطريقة الأولى إ0dطاعص‏ طعهatt use the attach and‏ : هذه الطريقة سريعة ولاكنها 
تشترط أن تکون قاعدة البیانات على شکل عcہنط؟‏ اہ 
ب- الطريقة الثانية إ0طاعn use the SQ1 Management object‏ : هذه الطريقة بطئية 
ولاكنها تعمل کی وان كانت قاعدة البيانات عم1آ 0١‏ 
لک تجعل قاعدة البيانات تقوم بعملية الاتصال من جدبد بال instance‏ ادا ما فشلت عملية النسخ فاننا نقوم 
NE‏ 
ويقصد بعملية طعه))هع] عملية اتصال قاعدة ما موجودة في مسار ما إلى ععمهایم] موجود في مسار ما 
إلى عء مهوم موجودا في الخادم العام . 
۷ تقوم بالظغط على زر )×عم تم نقوم بتحديد قاعدة البيانات 
ملاحظة ( بحالة وجود مشكلة في عملية النقل في النموذج أعلاة نرجع الي قاعدة البيانت ونجعلها عم1إره 
وبعد ذلك نرجع إلى مربع الحوار أعلاه ثم نختار الطريقة الثانية) . 
۸. نقوم بكتابة اسم قاعدة البيانات الجديدة وإذا اردت استبدالها بقاعدة بيانات سابقة موجوده نسميها 
بنفس الاسم لكي يحدث التبديل تم )×عم 
ملاحظة ( لكي تنجح العملية كما يجب أن يكون ارععA۸‏ إعم۷إعمء 8Q1‏ مفعل . 
عملية ال طعه))۸ لقاعدة البيانات : 
الغرض في هذه العملية هو عملية اتصال قاعدة البيانات في الخادم وهي حاليا توجد في أي مسار › ودائما 
نقوم بالعملية في قاعدة البيانات عندما نقوم بتحمیلها لزبون . 
ول و ق 
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. تحدد قاعدة البيانات‎ -١ 

Database wizard Analyze رlتخi‎ 1o01 من القائمة‎ -۲ 

۳- تم تظهر رسالة نختار الخيار الأول وsء1اء1اه)ء‏ والغرض من هذا الختيار هوتحليل البيانات 
الموجودة في قاموس البيانات وتخزينها في قاموس البيانات ثم الظغط على زر )×ع" 

يهر مرن حرا قرم با كار الكاقات الماد ته لك تله إلى الصف المت رذلك عن 
طريق تحديدها والظغط عىزر النقل > 

وعلي سبيل المثال سوف نقوم هنا باستخدام المستخدم )0ءء وتحديد خيرا ونقلها الي الجهه اليمنى 

تساعد {cعزطہ‏ dع1]cetعء‏ ثم الضغط على زر )×ع۸ 

لیر رسال نے اکتار الارن اط رق گل راد ت قعل الخار الارل د قر رسال نر 

الالی ت قمر رسال تخار واو ى طهر رسال تاد اة 


ناتي الأن الى الجانب العملي لتنقيب بيانات وسوف نستخدم للتطبيق 2005 Microsoft SQL Server‏ 
Mıning structures‏ 
Mıning models‏ 
الخطوات العملية لبناء هياكل التنقيب ونمادج التنقيب : 

bussiness intellegence development جalilربئll نقوم بالدخول الي‎ -١ 
محاضرة تنقيب بيانات بعد الغيد ج‎ - icrosofi Word س‎ ٠ 
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HÎ categories dba, EmployeeTerritories F1 LJ In x 
E3 3 L_ustomer_ usta crder Cetails 1 Hl : 
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Laktegoryhlarmê Fi 
Description ۳ : 
Tables : Picture FF 
HÎ categories (dba, 40n x 
HÎ] customertusto CategoryID m8 ۱ 
HE E] 2ustomerGDermag O TEES 7 CEWiey 
HÎ customers dba, ٤ 
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